7.4 평가 신뢰도 확보를 위한 프롬프트 엔지니어링 (Meta-Prompting) 7.4.1 G-Eval 프레임워크: 사고의 사슬(Chain-of-Thought)을 통한 평가 논리 유도 7.4.2 역할 부여(Role-playing)를 통한 페르소나 기반 평가의 일관성 강화 7.4.3 평가 근거(Reasoning) 강제 출력을 통한 화이트박스 테스트 구현 7.4.4 점수 스케일(Likert Scale)의 정의와 점수 편향(Central Tendency Bias) 최소화 기법 7.4.5 Few-shot 예제 제공을 통한 평가 기준의 정렬(Alignment)